Serveur d'exploration sur la TEI

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage

Identifieur interne : 000045 ( France/Analysis ); précédent : 000044; suivant : 000046

Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage

Auteurs : F. Bruneseaux [France]

Source :

RBID : Francis:524-99-13508

Descripteurs français

English descriptors

Abstract

Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.


Affiliations:


Links toward previous steps (curation, corpus...)


Links to Exploration step

Francis:524-99-13508

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1">
<inist:fA14 i1="01">
<s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">524-99-13508</idno>
<date when="1998">1998</date>
<idno type="stanalyst">FRANCIS 524-99-13508 INIST</idno>
<idno type="RBID">Francis:524-99-13508</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000059</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000070</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000066</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000066</idno>
<idno type="wicri:doubleKey">1291-1542:1998:Bruneseaux F:noms:propres:syntagmes</idno>
<idno type="wicri:Area/Main/Merge">000433</idno>
<idno type="wicri:Area/Main/Curation">000403</idno>
<idno type="wicri:Area/Main/Exploration">000403</idno>
<idno type="wicri:Area/France/Extraction">000045</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1">
<inist:fA14 i1="01">
<s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
<imprint>
<date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Corpus annotation</term>
<term>Natural language processing</term>
<term>Proper Name</term>
<term>Reference</term>
<term>Standardization</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Traitement automatique des langues naturelles</term>
<term>Nom propre</term>
<term>Syntagme nominal</term>
<term>Référence</term>
<term>Annotation de corpus</term>
<term>Type de texte</term>
<term>Standardisation</term>
<term>Français</term>
<term>Codage</term>
<term>SGML</term>
<term>TEI</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr">
<term>Codage</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
</list>
<tree>
<country name="France">
<noRegion>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
</noRegion>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/France/Analysis
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000045 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/France/Analysis/biblio.hfd -nk 000045 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Ticri
   |area=    TeiVM2
   |flux=    France
   |étape=   Analysis
   |type=    RBID
   |clé=     Francis:524-99-13508
   |texte=   Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage
}}

Wicri

This area was generated with Dilib version V0.6.31.
Data generation: Mon Oct 30 21:59:18 2017. Site generation: Sun Feb 11 23:16:06 2024